首页> 外文OA文献 >Discovering Valuable Items from Massive Data
【2h】

Discovering Valuable Items from Massive Data

机译:从海量数据中发现有价值的物品

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Suppose there is a large collection of items, each with an associated costand an inherent utility that is revealed only once we commit to selecting it.Given a budget on the cumulative cost of the selected items, how can we pick asubset of maximal value? This task generalizes several important problems suchas multi-arm bandits, active search and the knapsack problem. We present analgorithm, GP-Select, which utilizes prior knowledge about similarity be- tweenitems, expressed as a kernel function. GP-Select uses Gaussian processprediction to balance exploration (estimating the unknown value of items) andexploitation (selecting items of high value). We extend GP-Select to be able todiscover sets that simultaneously have high utility and are diverse. Ourpreference for diversity can be specified as an arbitrary monotone submodularfunction that quantifies the diminishing returns obtained when selectingsimilar items. Furthermore, we exploit the structure of the model updates toachieve an order of magnitude (up to 40X) speedup in our experiments withoutresorting to approximations. We provide strong guarantees on the performance ofGP-Select and apply it to three real-world case studies of industrialrelevance: (1) Refreshing a repository of prices in a Global DistributionSystem for the travel industry, (2) Identifying diverse, binding-affinepeptides in a vaccine de- sign task and (3) Maximizing clicks in a web-scalerecommender system by recommending items to users.
机译:假设有大量的项目集合,每个项目都有相关的成本和固有的效用,只有在我们承诺选择它们之后才显示出来。给定选定项目的累积成本预算,我们如何挑选一个最大价值的子集?该任务概括了几个重要问题,例如多臂匪,主动搜索和背包问题。我们介绍了一种算法GP-Select,它利用了关于项目之间相似性的先验知识,表示为一个核函数。 GP-Select使用高斯过程预测来平衡探索(估计物品的未知价值)和探索(选择高价值物品)之间的平衡。我们扩展了GP-Select,以便能够发现同时具有高实用性和多样化的设备。可以将我们对多样性的偏好指定为任意单调子模函数,该函数对选择相似项时获得的收益递减进行量化。此外,我们在实验中利用模型更新的结构实现了一个数量级(最高40倍)的加速,而无需重新排序。我们为GP-Select的性能提供了有力的保证,并将其应用于三个与工业相关的现实世界案例研究:(1)刷新旅游业全球分销系统中的价格存储库;(2)识别中的多种具有约束力的仿射肽疫苗设计任务;以及(3)通过向用户推荐产品来最大化Web规模推荐系统中的点击次数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号